Тема 10. СТАТИСТИЧНІ МЕТОДИ ВИМІРЮВАННЯ ЗВ’ЯЗКУ
Питання теми
• Залежність між окремими явищами.
• Методи вивчення зв’язку між явищами.
• Оцінка щільності зв’язку.
Основні терміни теми: функціональний та кореляційний зв’язок, прямолінійний та криволінійний зв’язок, щільність зв’язку, лінійний коефіцієнт кореляції, індекс кореляції.
Явища у суспільстві пов’язані між собою. До завдань статистики відноситься вивчення, вимір та кількісний вираз зв’язків між явищами суспільного життя.
Існують певні методи або прийоми вивчення зв’язків між явищами.
І. Метод паралельний рядів.
Сутність методу паралельних рядів полягає у тому, що матеріали дослідження розташовують у вигляді паралельних рядів і зіставляють їх між собою.
Таблиця 10.1. Залежність змінного виробітку робітників від стажу
Виробничий стаж, роки(х) Виробіток робітника за зміну, шт.(у)
1 5
2 5
3 6
4 7
5 7
6 8
7 7
8 9
9 10
10 12
Зіставлення двох рядів показує наявність зв’язку.
ІІ. Метод аналітичних групувань.
Таблиця 10.2. Залежність заробітної плати робітників-відрядників від продуктивності праці
Групи робітників-відрядників за рівнем виконання норм виробітку, % Кількість робітників, чол Середній процент виконання норм Середня місячна заробітна плата робітника-відрядника, грн.
до 100 141 98 288,5
100-120 749 106 334,0
120-150 308 129 365,9
150 і більше 42 152 406,8
Разом 1240 114 339,2
Сутність методу аналітичних групувань полягає у тому, що одиниці сукупності групуються за факторною ознакою і для кожної групи розраховується середня або відносна величина за результативною ознакою.
Метод аналітичних групувань використовується разом з методом середніх та відносних величин.
Зміни середніх або відносних величин результативної ознаки зіставляються зі змінами факторної ознаки для виявлення зв’язку між ними.
ІІІ. Балансовий метод.
Сутність цього методу полягає в тому, що взаємопов’язані показники розміщені у вигляді таблиці. Ці показники розташовані у певному порядку. Підсумки між окремими частинами таблиці мають бути одинакові, або має бути баланс.
Майже всі економічні зв’язки можна надати у вигляді балансів.
Таблиця 10.3. Баланс робочого часу по підприємству за рік
№
п.п Ресурси робочого часу Тис. люд-днів №
п.п Використання робочого часу Тис. люд-днів
1 Календарний фонд часу 604,6 1 Відпрацьовано робітниками 360,2
2 Святкові та вихідні 180,4 2 Час, який не використано з поважних причин 31,9
3. Чергові відпустки 30,1 3. Втрати робочого часу 2,0
Максимально можливий фонд робочого часу
(604,6-180,4-30,1) 394,1 Максимально можливий фонд робочого часу
(360,2+31,9+2,0) 394,1
ІV. Графічний метод
Графічний метод дозволяє виявити та наочно представити зв’язок, який існує між факторною та результативною ознаками
Рис. 10.1 Залежність змінного виробітку від виробничого стажу
У. Кореляційний аналіз.
Вивчення зв’язку не обмежується його встановленням, мають бути визначені форма та кількісна характеристика зв’язку, ступінь його щільності.
За формою зв’язку кореляційні залежності бувають прямолінійними і криволінійними . при прямолінійній кореляційній залежності рівним змінам середніх значень факторної ознаки відповідають приблизно рівні зміни середніх значень результативної ознаки.
При криволінійній кореляційній залежності рівним змінним середніх значень факторної ознаки відповідають нерівні зміні середніх значень результативної ознаки.
Характеристика кореляційного зв’язку – лінія регресії. Теоретична лінія регресії описується певною функцією, яку називають рівнянням регресії.
В економічних дослідженнях часто доводиться мати справу з прямолінійною формою зв’язку, яка визначається рівнянням прямої
Параметри рівняння прямої лінії визначаються способом найменших квадратів. Суть його полягає у складанні і розв’язанні системи двох рівнянь з двома невідомими.
де n – кількість членів у кожному з двох рядів, що порівнюються.
Розглянемо наступну прямолінійну форму зв’язку, яка буде визначатися рівнянням прямої.
Таблиця 10.4
№ підпр. Вироблено продукції на одного працівника, тис грн.(у) Енергоозброєність праці одного працівника кВт-год (х) х2 ху
1 6.0 5 25 30,0 5,54
2 6.5 7 49 45,5 6,96
3 6.2 6 36 37,2 6,25
4 7.1 8 64 56,8 7,67
5 5.8 4 16 23,2 4,83
6 4.5 5 25 22,5 5,54
7 7.2 7 49 50,4 6,96
8 8.3 8 64 66,4 7,67
9 6.4 5 25 32,0 5,54
10 3,8 4 16 15,2 4,83
61,8 59 369 379,2 61,79
Для визначення параметрів рівняння поділимо кожен член рівняння на коефіцієнт при а та із другого рівняння віднімемо перше.
Можна встановити рівень виробництва продукції (теоретичний) при певному рівні енергоозброєності праці. З підвищенням енергоозброєності праці на одну кВт-годину виробництво продукції збільшиться на 0,71 тис.грн.
Було розглянуто зв’язок між двома ознаками результативною (у) та факторною (х).
Вивчається також зв’язок між результативною ознакою та двома і більш факторними. Це здійснюється за допомогою множинної кореляції.
Розглянемо зв’язок між виробітком у зміну та тривалістю простоїв протягом зміни, виробничим стажем.
Таблиця 10.5
№
п.п Виробі-ток за зміну,
шт.(у) Тривалість простоїв протягом зміни,хв.(х) Вироб-ничий стаж,роки(z) ху zy xz x2 z2
1 390 19 3 7410 1170 57 361 9
2 387 15 2 5805 774 30 225 4
3 389 17 3 6613 1167 51 289 9
4 401 11 5 4411 2005 55 121 25
5 394 14 5 5516 1970 70 196 25
6 394 12 4 4728 1576 48 144 16
7 395 16 3 6320 1185 48 256 9
8 391 13 5 5083 1955 65 169 25
9 404 10 6 4040 2424 60 100 36
10. 395 13 4 5135 1580 52 169 16
Разом 3940 140 40 55061 15806 536 2030 174
Розв’язавши цю систему рівнянь, маємо:
а=395,4; b=-0,7; с=2,09.
Рівняння зв’язку між ознаками має такий вигляд:
Для аналітичного вираження криволінійної залежності найчастіше використовують гіперболічне і параболічне кореляційні рівняння .
Рівняння гіперболи має вигляд:
Щоб визначити параметри а і b цього рівняння способом найменших квадратів, складають і розв’язують систему рівнянь з двома невідомими
Таблиця 10.6
№ підпр. Собівартість одиниці продукції, грн.(у) Вироблено продукції тис(х)
1 2,3 45 0,022 0,000484 0,0506 2,6
2 2,5 48 0,021 0,000441 0,0525 2,8
3 2,0 40 0,025 0,000625 0,0500 2,0
4 2,8 51 0,021 0,000441 0,0588 3,1
5 3,0 50 0,020 0,000400 0,0600 3,0
6 2,4 38 0,026 0,000676 0,0624 1,7
7 3,2 55 0,018 0,000324 0,0576 3,4
8 4,0 60 0,017 0,000289 0,0680 3,7
9 2,1 41 0,024 0,000576 0,0504 2,1
10 3,5 56 0,018 0,000324 0,0630 3,4
∑ 27,8 484 0,212 0,004580 0,5733 27,8
Розв’язавши цю систему, дістаємо:
Отже, рівняння зв’язку між собівартістю одиниці продукції та виробництвом продукції матиме такий вигляд:
Щільність зв’язку вивчають за допомогою спеціальних показників
При прямолінійному кореляційному зв’язку використовують коефіцієнт кореляції:
Маємо досить щільний зв’язок між виробленою продукцію на підприємствах на одного працівника та енергоозброєність праці.
Коефіцієнт кореляції використовують тільки в тих випадках, коли зв’язок прямолінійний. Якщо зв’язок криволінійний, то використовують індекс кореляції. Його формула:
де – теоретичні значення;
Таблиця 10.7
y x Y
2,3 45 2,6 0,09 0,23
2,5 48 2,8 0,09 0,08
2,0 40 2,0 0,00 0,61
2,8 51 3,1 0,09 0,00
3,0 50 3,0 0,00 0,05
2,4 38 1,7 0,49 0,14
3,2 55 3,4 0,04 0,18
4,0 60 3,7 0,09 1,49
2,1 41 2,1 0,00 0,46
3,5 56 3,4 0,01 0,52
27,8 484 27,8 0,90 3,76
грн.
Множинний коефіцієнт кореляції показує щільність зв’язку між результативною ознакою і сукупним впливом двох факторних ознак.
Якщо одна ознака має кількісний вираз, а інша альтернативний, то показником щільності зв’язку є бісеріальний коефіцієнт кореляції
Таблиця 10.8
Групи робітників за участю у винахідництві Процент виконання норм Всього
90-100 100-110 110-120 120-130 130-140
Беруть участь 5 18 17 28 32 100
Не беруть участь 7 8 15 14 6 50
Всього 12 26 32 42 38 150
де р – частка першої групи
q – частка другої групи
z –ордината нормальної кривої (таблична величина)
Для виміру щільності зв’язку між двома ознаками, які мають альтернативний вираз використовуються різні коефіцієнти. Коефіцієнт асоціації. Для його розрахунку використовується така таблиця:
Таблиця 10.9
Ознака А не А
В а B a+b
не В с d c+d
а+с b+d
, де
a,b,c,d - частоти в таблиці (кількість одиниць одночасного прояву альтернативних ознак).
Таблиця 10.10. Залежність урожайності від внесення добрив
Ділянки за урожайністю Внесені добрива Не внесені добрива Всього
Підвищили 50 10 60
Не підвищили 10 30 40
Всього 60 40 100
Зв’язок внесенням добрив і урожайністю щільний.
Завжди менше
Зв’язок між внесенням добрив існує, але не досить щільний.
Коефіцієнт Фехнера
Його розрахунок полягає у тому, що зіставляються знаки відхилень від середньої по кожній ознаці:
, де
a – число пар з однаковими знаками;
b –число пар з різними знаками.
Null
Скористаємось даними про енергоозброєність праці одного працівника та виробництвом продукції на одного працівника
Таблиця 10.11
№
підпр. Виробництво тис.грн. (у) Енерго-озброєність
квт/год (х) Ранги
по х по у х-у
1 6,0 5 - - 4 4 0,0 0,00
2 6,5 7 + + 7,5 7 0,5 0,25
3 6,2 6 + + 6 5 1,0 1,00
4 7,1 8 + + 9,5 8 1,5 2,25
5 5,8 4 - - 1,5 3 -1,5 2,25
6 4,5 5 - - 4 2 2,0 4,00
7 7,2 7 + + 7,5 9 -1,5 2,25
8 8,3 8 + + 9,5 10 -0,5 0,25
9 6,4 5 + + 4 6 -2 4,00
10 3,8 4 - - 1,5 1 0,5 0,25
Разом 61,8 59 16,5
тис. грн.; кВт-год
Коефіцієнт Фехнера показує, що між енергоозброєністю та виробленою продукцією існує досить щільний зв’язок
Коефіцієнт Спірмена
(рангової кореляції):
, де n – кількість рангів
де
m – кількість експертів;
n – кількість факторів.
Оцінка якості виробу в сумі не може бути більше 15 балів.
Таблиця 10.12
експерти
фактори 1 2 3 4 5 6 7 8 9 10
x1 1 2 1 2 2 1 1,5 1 1,5 1 14,0 -16,0 256,00
x2 3 1 2 1 3 3 1,5 2.5 1,5 2 20,5 -9,5 90,25
x3 5 3.5 4 3 4 2 3 2.5 3 3 34,0 4,0 16,00
x4 4 3.5 5 4.5 1 4.5 5 4 5 4.5 39,0 9,0 81,00
x5 2 5 3 4,5 5 4,5 4 5 4 4,5 42,5 12,5 156,25
Всього 15 15 15 15 15 15 15 15 15 15 150 - 619,5
x1 – відповідність розміру
x2 – якість обробки
x3 - фурнітура
x4 - матеріал
x5 – відповідність моді
Зв‘язок між оцінкою експертів якості виробу та факторами якості існує, але не досить щільний.
Питання для самоперевірки
1. Зв’язок між явищами і процесами суспільного життя
2. Метод паралельних рядів
3. Метод аналітичного групування
4. Балансовий метод
5. Сутність кореляційного зв’язку
6. Напрямок зв’язку та його щільність
7. Непараметричні методи вимірювання щільності кореляційного зв’язку
Графічний метод
Питання теми
1. Сутність та призначення графіків.
2. Основні види графіків
3. Картограми та картодіаграми
Основні терміни теми: статистичний графік, графічний образ, просторові орієнтири, масштабні орієнтири, експлікація, діаграма, картограма, картодіаграма.
Графічний метод є продовженням та доповненням табличного методу.
Статистичний графік являє собою креслення, на якому за допомогою умовних геометричних фігур (ліній, крапок або інших символів) зображуються статистичні дані.
Використання графічного методу робить числа наочними, доступними, зрозумілими, цікавими. Графіки використовують не тільки для імітації явищ та процесів, але і для їх аналізу.
Перед побудовою графіка необхідно з’ясувати поставлені завдання, після чого вибрати правильний варіант графічного рішення.
У статистичному графіку розрізняють такі основні елементи: поле графіку, графічний образ, просторові та масштабні орієнтири, експлікація графіку.
Поле графіка – місце, на якому він виконується. Поле графіка характеризується його форматом (розмірами та пропорціями сторін). Розмір поля графіка залежить від його призначення. Сторони поля статистичного графіка, як правило, знаходяться у певній пропорції. Вважається, що найбільш оптимальним для зорового сприйняття є графік, який виконано на полі прямокутної форми зі співвідношенням сторін від 1:1,3 до 1:1,5 (правило золотого перетину). Іноді використовується поле графіка з рівними сторонами.
Графічний образ – це символічні знаки, за допомогою яких зображуються статистичні дані. Вони можуть бути різноманітними: крапки, відрізки прямих, кола, сектори, геометричні фігури, силуети.
Просторові орієнтири визначають розміщення знаків на полі графіка. Вони залежать від системи координат, яку використовують. В статистичних графіках частіш за все використовується система прямокутних (декартових) координат. Іноді можуть бути використані полярні координати.
Масштабні орієнтири – це еталони знака, які відображають величину геометричних знаків. Вони зображуються у вигляді кругів, прямокутників, квадратів і, як правило, виносяться з поля графіка. На масштабній шкалі проставляються круглі або закруглені значення величини, які зображуються.
Експлікація графіка – це словесне пояснення змісту графіка та значення кожного його географічного знака.
За способом побудови статистичні графіки поділяються на діаграми, картограми, картодіаграми. Найбільш поширеними є діаграми.
Діаграма – це креслення, на якому статистична інформація зображується за допомогою геометричних фігур або символічних знаків.
Діаграми поділяються:
а) на діаграми порівняння;
б) на структурні діаграми;
в) на динамічні діаграми;
г) на графіки зв’язку.
Діаграми порівняння показують співвідношення різних статистичних сукупностей за будь-якою ознакою, яка змінюється у просторі. В них надається одномірне графічне зображення варіюючої ознаки в одному масштабі для всіх значень цієї ознаки. Діаграми порівняння бувають стовпчикові та стрічкові.
Побудова стовпчикових та стрічкових діаграм вимагає дотримання низки правил. Найважливіше правило – це відповідність стовпчиків за висотою, а стрічок за довжиною відображаємих цифр. Не можна допускати розрив масштабної шкали, а також починати її не від нуля. Відстань між стовпчиками повинна бути однаковою (рис. 11.1).
Якщо прямокутники, які відображають числа, розташувати не по вертикалі, а по горизонталі, то діаграма буде стрічковою.
При побудові діаграм висота стовпчиків або довжина стрічок змінюється у порядку зростання або спаду.
Структурні діаграми дозволяють зіставляти статистичні сукупності за складом. До структурних діаграм належать перш за все діаграми питомої ваги, які характеризують відношення окремих частин сукупності до її загального підсумку. За видом вони поділяються на стовпчикові, стрічкові та секторні. В секторних діаграмах структура зображується за допомогою різної штриховки або розкраски секторів кругами, які відображають питому вагу окремих частин сукупності. За допомогою секторних діаграм можна також показати динаміку структури. Для цього будується декілька кругів з різними радіусами, які відповідають різній величині ознаки об’єкту в різний час. Краще структуру відображати у процентах. 1% відображається сектором в 360.
Побудуємо секторну діаграму за такими даними:
Таблиця 11.1
Розподіл населення України за статтю у 2001 році.
Групи населення за статтю Чисельність населення, млн. чол. У процентах до всього населення
Чоловіки 22,5 46,4
Жінки 26,0 53,6
Всього 48,5 100,0
Визначимо значення дуг для круга:
1) чоловіки 3,6*46,4=1670
2) жінки 3,6*53,6=1920
Круг ділимо на сектори відповідно розрахованим дугам.
Секторні діаграми слід використовувати у тих випадках, коли сукупність ділиться не більше ніж на 4-5 частин. Можна також використовувати для зіставлення структур в динаміці за наявності значних їх розбіжностей.
Широке розповсюдження мають динамічні діаграми. У відповідності з назвою цього вида графіків їх використовують для показу змін явища у часі. Такі зміни можна надати за допомогою стовпчикової або стрічкової діаграми.
Відмінність стовпчикової діаграми від статистичної кривої полягає у тим, що стовпчики можуть бути розташовані окремо один від одного перериваючи часову послідовність. Для побудови лінійних діаграм використовується таке розташування статистичних даних:
- на осі абсцис відкладаються варіанти показника, який вивчається (або часу);
- на осі ординат – величина показника, який вивчається . За відмітками (точками) обох осей координат визначається положення кожного рівня на полі графіку. Послідовно поєднуючи точки відрізками лінії, отримують емпіричну лінію графіку (статистичну криву). За видом цієї лінії можна судити про характер розвитку явища, яке досліджується.
Від стовпчикових та стрічкових діаграм, діаграми цього виду відрізняються також наявністю двох масштабів: один – по осі абсцис, другий – по осі ординат. На масштабній шкалі числа наносяться зліва направо та знизу до гори. Статистичні дані не слід показувати ні на масштабній шкалі, ні в середині графіку. Їх можна надати у вигляді таблиці. Графік не треба переривати. Рівним проміжкам часу повинні відповідати рівні відрізки масштабної шкали.
Лінія, яка поєднує точки несуміжних років надається пунктиром.
У деяких випадках для кращого виявлення характеру динаміки ряду рекомендується при побудові вертикального масштабу відмовлятися від початку масштабу з нуля, показав це за допомогою “розриву” графіка. Якщо характеризуємо не абсолютну величину рівня, а його коливання, то в такому випадку вертикальний масштаб можна зробити більш крупним, орієнтуючись на фактичні дані.
Побудуємо лінійний графік за такими даними:
Таблиця 11.2
Динаміка платних послуг в Україні за 1995 – 2000 роки (млн. грн.)
Рік 1995 1996 1997 1998 1999 2000
Обсяг платних послуг, млн. грн. 3,7 7,6 9,3 9,8 11,6 15,8
Не бажано на одному лінійному графіку зображувати велику кількість показників, оскільки це призводить до втрати наочності. Якщо на одному графіку необхідно відобразити різнойменні показники, то треба зробити перерахунок абсолютних величин у відносні (за базу порівняння беруть рівень одногу року). У такому випадку всі лінії будуть виходити з однієї точки, яку взято за 100%.
Розглянемо побудову графіків зв’язку між явищами на такому прикладі:
Таблиця 11.3
Залежність місячної заробітної плати робітників-відрядників від стану роботи
Групи робітників-відрядників за стажем роботи, роки Кількість робітників-відрядників, чол. Середньомісячна заробітна плата, грн.
До 5 30 300
5 – 10 45 399,2
10 – 15 100 460,8
15 – 20 50 540,3
20 і більше 10 560,7
Всього 235 449,6
Картограми і картодіаграми використовуються для наочного зображення економіко-географічної характеристики явищ, які досліджуються. Вони показують розміщення явища по певній території – країні, області, району.
Картограма – це така статистична карта, на якій розподіл ознаки по території відображається умовними знаками (точками, штриховкою, кольором тощо). Знаки повинні відповідати певним інтервалам значень величини цієї ознаки. Вини розміщаються в середині контура кожного району відповідно середньому значенню показника по одному району. Картограми бувають фонові і точкові. Найчастіше використовують фінові картограми, коли розподіл явища по території зображується різноманітними розкрасками територіальних одиниць з різною насиченістю кольору. Замість розкраски використовується штриховка різної інтенсивності.
Сутність точкової картограми полягає в тім, що символами графічного зображення статистичних даних є точки, розміщені в межах певних територіальних границь. Кожній точці, яка нанесена на картограму, умовно надається конкретне числове значення. Це дозволяє використовувати її як інструментарій прямого рахунку.
Картограми головним чином мають аналітичне значення. Перед дослідником постає задача ретельно розглянути та проаналізувати отриману статистичну карту.
Основна мета картограмування – це виявлення закономірностей розміщення. Картограми повинні знаходити групи районів, областей, які мало відрізняються за величиною показника.
Картодіаграма представляє собою поєднання географічної карти з діаграмою. Це поєднання полягає у тім, що фігури, які використовують в діаграмі не проставляються в ряд від меншої до більшої, а розкидані по карті у відповідності з тим районом або областю, яку вони представляють.
Картодіаграму використовують для того, щоб показати структурні розбіжності районів, областей. Використовують секторні діаграми, які розташовують на карті.
Картограми та картодіаграми дають можливість вивчати особливості різних районів, областей та визначити вплив географічних факторів від факторів іншого порядку. До картограм відносять і карти міжрайонних зв’язків.
Питання для самоперевірки
1. Що являють собою статистичні графіки?
2. Основні елементи графіку.
3. Види статистичних графіків.
4. Як побудувати стовпчикові та стрічкові діаграми?
5. Як побудувати секторні діаграми?
6. Для чого використовують лінійні діаграми?
7. Для чого використовують картограми і картодіаграми?
8. Що являє собою картограма?
9. Що являє собою картодіаграма?